년 AI 및 로봇 연구 동향
1. 서론: 21세기 AI 혁명의 서막
1996년은 인공지능(AI)과 로봇 공학 분야에서 중요한 변곡점을 형성한 해였다. 길었던 “AI 겨울“의 침체를 지나, 학계는 규칙 기반의 상징주의 AI가 가진 명백한 한계를 인식하고 통계적 및 확률적 방법론으로 무게 중심을 옮기고 있었다.1 특히 신경망 연구는 1980년대에 다시 불붙은 “연결주의(Connectionism)“의 흐름 속에서 새로운 이론적 돌파구를 모색하던 시기였다.2 이러한 지적 성숙은 기술 구현의 현실적 요구와 맞물리며 강력한 시너지를 창출했다.
동시에 로봇 공학 분야는 경제적 재도약의 기회를 맞이하고 있었다. 1990년대 초반의 경기 침체로 인해 급감했던 전 세계 산업용 로봇 판매량은 1993년을 저점으로 1995년에 26%, 1996년에는 11%의 견고한 성장세를 보이며 1990년의 최고 수준을 회복했다.3 이러한 시장의 회복은 로봇 공학 연구 개발에 대한 산업계의 관심과 투자가 다시 활성화되고 있음을 시사하는 중요한 지표였다.
본 보고서는 1996년을 기계학습의 이론적 심화와 로봇 공학의 물리적 구현이 교차하며 미래 기술의 방향성을 결정한 해로 규정한다. 제1부에서는 장단기 메모리(LSTM), CONDENSATION 알고리즘, 그리고 초기 웹 개인화 에이전트와 같은 AI 분야의 핵심 이론적 진보를 분석한다. 제2부에서는 혼다 P2 휴머노이드 로봇의 공개, 안정적 이족보행을 가능하게 한 영 모멘트 포인트(ZMP) 제어, 그리고 고차원 공간 탐색의 새로운 해법을 제시한 무작위 경로 계획 방법론 등 로봇 공학의 획기적인 성과를 심층적으로 다룬다. 이를 통해 1996년에 뿌려진 기술적 씨앗들이 어떻게 21세기 AI 혁명의 토대가 되었는지 그 유산을 조명하고자 한다.
| 학회명 (Full Name) | 약어 (Acronym) | 개최지 | 주요 의제 (Key Themes) |
|---|---|---|---|
| Advances in Neural Information Processing Systems 9 | NIPS ’96 | 미국 덴버 | 신경망 이론, 강화학습, 베이즈 학습, 비지도 학습, 시각 추적 5 |
| Thirteenth International Conference on Machine Learning | ICML ’96 | 이탈리아 바리 | 앙상블 방법(부스팅), 결정 트리, 베이즈 모델, 강화학습, 통계적 방법론 통합 1 |
| Thirteenth National Conference on Artificial Intelligence | AAAI-96 | 미국 포틀랜드 | 지능형 에이전트, 강화학습, 지식 표현, 통합 AI 시스템, 불확실성 추론 8 |
| IEEE/RSJ International Conference on Intelligent Robots and Systems | IROS ’96 | 일본 오사카 | 지능형 로봇, 스마트 머신, 이동 로봇, 조작, 인간-로봇 상호작용 10 |
| IEEE International Conference on Robotics and Automation | ICRA ’96 | 미국 미니애폴리스 | 로봇 자동화, 경로 계획, 센서 기술, 인간-로봇 상호작용, 조작 12 |
2. 기계학습의 패러다임 전환과 지능형 시스템의 부상
2.1 장: 순환 신경망의 한계 극복 - 장단기 메모리(LSTM)의 태동
2.1.1 기존 순환 신경망(RNN)의 근본적 문제: 기울기 소실
순환 신경망(Recurrent Neural Network, RNN)은 내부에 존재하는 피드백 연결을 통해 이전 타임스텝의 정보를 현재의 활성화 값 형태로 저장함으로써 시퀀스 데이터를 처리하는 데 이론적 강점을 가졌다.14 이러한 구조는 네트워크에 일종의 “단기 기억” 능력을 부여했다.15 하지만 이 잠재력은 심각한 학습상의 난제에 부딪혔다.
시간에 따라 역전파(Backpropagation Through Time, BPTT) 알고리즘을 사용하여 RNN을 훈련할 때, 오차 신호는 시간의 흐름을 거슬러 과거로 전파된다. Sepp Hochreiter가 1991년 그의 논문에서 분석했듯이, 이 과정에서 오차 신호의 크기는 네트워크 가중치에 지수적으로 의존하게 된다.14 그 결과, 오차 신호가 과거로 전파되면서 기하급수적으로 커져 발산하거나(기울기 폭발), 반대로 0에 가깝게 소멸하는(기울기 소실) 현상이 발생했다.15 특히 기울기 소실 문제는 현재의 출력과 먼 과거의 입력 간의 연관성, 즉 장기 의존성(long-term dependencies)을 학습하는 것을 거의 불가능하게 만들었다.18 이는 RNN이 가진 이론적 가능성과 실제 구현 사이의 깊은 괴리를 상징하는 근본적인 한계였다.
2.1.2 1996년의 돌파구: Long Short-Term Memory
이러한 RNN의 고질적인 문제를 해결하기 위한 획기적인 아이디어가 1996년 NIPS 학회에서 Sepp Hochreiter와 Jürgen Schmidhuber에 의해 처음 제시되었고, 이듬해인 1997년 Neural Computation 저널에 완전한 형태로 발표되었다.16 이들이 제안한 장단기 메모리(Long Short-Term Memory, LSTM) 아키텍처는 문제의 근원인 ‘오차 흐름’ 자체를 제어하는 새로운 구조를 네트워크에 내장하는 방식으로 접근했다.
LSTM의 가장 핵심적인 혁신은 **‘Constant Error Carousel (CEC)’**이라 불리는 메커니즘이다.14 이는 메모리 셀(memory cell) 내부에 가중치가 1.0으로 고정된 자기 순환 연결을 두어, 오차 신호가 여러 타임스텝에 걸쳐 감쇠하거나 증폭되지 않고 그대로 흐를 수 있는 ‘회전목마’ 같은 통로를 만드는 것이다.14 이 구조는 기울기 소실 문제를 원천적으로 방지하여 장기 기억을 가능하게 했다.
하지만 CEC만으로는 정보가 무분별하게 축적되거나 다른 정보와 충돌하는 문제가 발생할 수 있었다. 이를 해결하기 위해 LSTM은 곱셈 연산을 기반으로 하는 게이트(Gate) 유닛을 도입했다. 이 게이트들은 CEC로의 정보 흐름을 동적으로 제어하는 밸브 역할을 한다. 1996-1997년 초기 아키텍처는 두 종류의 게이트로 구성되었다.14 **입력 게이트(input gate)**는 새로운 정보가 메모리 셀에 기록되는 것을 제어하고, **출력 게이트(output gate)**는 메모리 셀에 저장된 정보가 네트워크의 다른 부분으로 전달되는 것을 제어한다. 이 게이트 구조 덕분에 네트워크는 데이터로부터 ’무엇을, 언제 기억하고 사용할지’를 스스로 학습할 수 있게 되었다.
초기 LSTM 메모리 블록의 작동 방식은 다음과 같은 수식으로 표현된다.
- 메모리 셀의 상태 업데이트 (c_j(t)): 이전 상태 c_j(t-1)에 입력 게이트 y^{in_j}(t)를 통과한 새로운 정보 g(net_{c_j}(t))가 더해진다.
c_j(t) = c_j(t-1) + g(net_{c_j}(t)) \cdot y^{in_j}(t)
- 입력 게이트의 활성화 (y^{in_j}(t)): 입력 게이트의 활성화 함수 f_{in_j}를 통해 계산된다.
y^{in_j}(t) = f_{in_j}(net_{in_j}(t))
- 출력 게이트의 활성화 (y^{out_j}(t)): 출력 게이트의 활성화 함수 f_{out_j}를 통해 계산된다.
y^{out_j}(t) = f_{out_j}(net_{out_j}(t))
- 최종 셀 출력 (y^{c_j}(t)): 메모리 셀의 현재 상태 c_j(t)가 활성화 함수 h를 거친 후, 출력 게이트 y^{out_j}(t)에 의해 조절되어 최종 출력이 결정된다.
y^{c_j}(t) = y^{out_j}(t) \cdot h(c_j(t))
2.1.3 LSTM의 의의와 영향
LSTM의 등장은 단순한 성능 개선을 넘어선 패러다임의 전환이었다. 실험을 통해 1000 타임스텝을 초과하는 매우 긴 시차(time lag)를 가진 문제도 성공적으로 학습할 수 있음을 증명함으로써, 기존 RNN 알고리즘으로는 해결이 불가능했던 영역을 개척했다.14
이는 신경망 연구의 방향성에 중요한 시사점을 던졌다. 단순히 네트워크를 더 깊게 쌓는 방식(deepening)에만 집중하는 것이 아니라, 네트워크 내부에 정보 흐름을 지능적으로 관리하는 특화된 메커니즘을 설계하는 것(architectural intelligence)이 문제 해결의 핵심이 될 수 있음을 보여주었다. LSTM이 제시한 ’게이트를 통한 동적 정보 제어’라는 철학은 이후 GRU(Gated Recurrent Unit)나 트랜스포머(Transformer)의 어텐션 메커니즘과 같은 후대의 모든 정교한 시퀀스 모델링 아키텍처에 깊은 영향을 미치는 사상적 토대가 되었다.
2.2 장: 확률적 추론과 시각 지능 - CONDENSATION 알고리즘
2.2.1 동적 시각 추적의 난제: 클러터와 비-가우시안 불확실성
움직이는 객체를 비디오 시퀀스에서 추적하는 기술은 컴퓨터 비전의 오랜 과제였다. 특히 배경에 추적 대상과 유사한 형태나 움직임을 가진 요소들이 많은, 소위 ‘조밀한 클러터(dense visual clutter)’ 환경에서는 문제가 극도로 어려워진다.20 이러한 환경에서는 객체의 실제 위치에 대한 불확실성이 단일한 정점을 가지는 분포가 아니라, 여러 개의 가능한 가설을 동시에 포함하는 다봉형 분포(multi-modal distribution)의 형태를 띠게 된다.
당시 널리 사용되던 칼만 필터(Kalman Filter)는 상태의 불확실성을 단일 가우시안 분포로 가정한다. 가우시안 분포는 단봉형(unimodal)이므로, 여러 개의 분리된 가설을 동시에 표현할 수 없다.21 따라서 클러터가 심한 환경에서 칼만 필터는 잘못된 가설에 수렴하거나 추적에 실패하기 쉬웠다. 이는 현실 세계의 ’모호함’을 다루기에는 기존의 결정론적 혹은 단일 가우시안 기반의 추론 방식이 근본적인 한계를 가지고 있음을 보여주었다.
2.2.2 NIPS 1996의 해법: CONDENSATION (Conditional Density Propagation)
1996년 NIPS 학회에서 Andrew Blake와 Michael Isard는 이러한 문제에 대한 혁신적인 해법인 CONDENSATION 알고리즘을 발표했다.5 이 알고리즘은 베이즈 필터링 프레임워크에 기반한 입자 필터(Particle Filter)의 일종으로, 확률 분포를 다루는 방식을 근본적으로 바꾸었다.24
CONDENSATION의 핵심 아이디어는 확률 분포를 해석적인 함수 형태로 표현하는 대신, 가중치가 부여된 다수의 무작위 샘플 집합(weighted sample set)으로 근사하는 ‘Factored Sampling’ 기법을 동적 추적 문제에 적용한 것이다.21 즉, 단 하나의 최적해(single best guess)를 찾는 대신, 가능한 모든 가설의 ‘분포’ 자체를 샘플들의 집합으로 표현하고 시간에 따라 전파시키는 접근법이다. 이 과정은 순환적인 3단계로 구성된다 20:
-
선택 (Selection/Sampling): 이전 타임스텝(t−1)의 샘플 집합에서 각 샘플의 가중치(πt−1(n))에 비례하는 확률로 현재 타임스텝(t)을 위한 새로운 샘플들을 복원 추출한다. 가중치가 높은 가설(샘플)은 여러 번 선택될 가능성이 높고, 가중치가 낮은 가설은 도태된다.
-
예측 (Prediction - Drift & Diffusion): 선택된 각 샘플에 미리 학습된 동역학 모델(p(xt∣xt−1))을 적용하여 다음 상태를 예측한다. 이 과정에는 시스템의 일반적인 움직임을 나타내는 결정론적 이동(drift)과 예측 불가능한 변화를 모델링하는 확률적 확산(diffusion)이 모두 포함된다.
-
측정 및 갱신 (Measurement/Update): 예측된 각 샘플(st(n))에 대해, 현재 프레임의 관측 정보(zt, 예: 이미지 엣지)가 주어졌을 때의 가능도(p(zt∣st(n)))를 계산한다. 이 가능도 값이 각 샘플의 새로운 가중치(πt(n))가 된다. 관측 정보와 잘 부합하는 샘플은 높은 가중치를, 그렇지 않은 샘플은 낮은 가중치를 부여받는다.
이러한 상태 밀도 전파(State Density Propagation) 과정은 시간 변화에 따른 베이즈 정리의 적용과 동일하며, 다음과 같은 수식으로 표현될 수 있다 20:
p(x_t \vert Z_t) = k_t p(z_t \vert x_t) \int p(x_t \vert x_{t-1}) p(x_{t-1} \vert Z_{t-1}) dx_{t-1}
여기서 Z_t = \{z_1,..., z_t\}는 시간 t까지의 모든 관측의 집합이며, k_t는 정규화 상수이다.
2.2.3 CONDENSATION의 혁신성
CONDENSATION 알고리즘은 칼만 필터보다 개념적으로 더 단순하면서도, 비선형 동역학 모델과 비-가우시안 노이즈를 자연스럽게 처리할 수 있는 높은 일반성을 확보했다.20 무작위 샘플링을 사용함에도 불구하고, 잘 학습된 동역학 모델이 탐색 공간을 효과적으로 제한해주기 때문에 거의 실시간으로 작동이 가능했다.25
이 알고리즘의 진정한 기여는 특정 추적 문제를 해결한 것을 넘어, 복잡한 고차원 확률 분포를 다루는 일반적인 계산 프레임워크, 즉 순차적 몬테카를로(Sequential Monte Carlo) 방법을 컴퓨터 비전 커뮤니티에 효과적으로 소개하고 대중화시켰다는 데 있다. 불확실성을 제거해야 할 대상이 아닌, 추론 과정의 핵심 정보로 적극 활용하는 베이즈적 사고방식이 실제 비전 문제에 성공적으로 적용될 수 있음을 증명한 것이다.
2.3 장: 월드 와이드 웹과 개인화 에이전트 - Syskill & Webert
2.3.1 시대적 배경: 초기 웹과 정보 과잉의 서곡
1996년은 월드 와이드 웹(WWW)이 대중 속으로 빠르게 확산되던 시기였다. 정보의 양이 폭발적으로 증가하면서, 사용자가 방대한 웹 공간에서 자신에게 진정으로 유용하고 흥미로운 정보를 찾는 것은 점차 어려운 과제가 되었다.26 이러한 ‘정보 필터링’ 또는 ‘정보 과부하’ 문제는 지능형 소프트웨어 에이전트 연구의 중요한 동기가 되었다.27
2.3.2 AAAI-96에서 제안된 지능형 에이전트
이러한 시대적 배경 속에서, Michael Pazzani와 그의 동료들은 1996년 AAAI 학회에서 ’Syskill & Webert’라는 지능형 웹 에이전트를 발표했다.27 이 시스템은 사용자가 방문하고 평가한 웹 페이지들을 분석하여 개인의 관심사 프로파일을 학습하고, 이를 통해 새로운 정보를 추천하는 것을 목표로 했다.26
Syskill & Webert의 시스템 아키텍처는 다음과 같다. 사용자는 특정 주제(topic)에 대해 미리 수동으로 구축된 ’인덱스 페이지(index page)’에서 웹 서핑을 시작한다. 방문한 페이지에 대해서는 ‘hot(매우 흥미로움)’, ‘lukewarm(그저 그럼)’, ’cold(흥미 없음)’의 세 단계로 평가를 남길 수 있다.29 시스템은 이 평가 데이터를 지속적으로 수집하여 해당 주제에 대한 사용자 프로파일을 구축하고 갱신한다.26
학습된 프로파일은 두 가지 방식으로 활용되었다. 첫째, 아직 방문하지 않은 인덱스 페이지의 다른 링크들에 대해 사용자의 선호도를 예측하고, 그 결과를 스마일리나 금지 표시 같은 직관적인 아이콘으로 표시해 주었다. 둘째, 학습된 프로파일을 기반으로 LYCOS와 같은 당시의 검색 엔진에 최적화된 검색 쿼리를 자동으로 생성하여, 웹 전체에서 사용자가 흥미를 가질 만한 새로운 페이지를 찾아주었다.26
2.3.3 학습 메커니즘: 정보 이론과 나이브 베이즈 분류
Syskill & Webert의 학습 메커니즘은 콘텐츠 자체에 집중하는 ‘콘텐츠 기반 필터링(Content-based filtering)’ 접근법의 초기 형태를 보여준다.
먼저, 각 웹 페이지의 HTML 소스를 분석하여 단어들의 집합으로 변환하고, 이를 ’단어의 존재 여부’를 나타내는 불리언 특징 벡터(Boolean feature vector)로 표현했다.26 모든 단어를 특징으로 사용하면 계산량이 많고 노이즈가 심해지므로, 정보 이론에 기반한 특징 선택 기법을 사용했다. 즉, ’hot’으로 평가된 페이지와 ’cold’로 평가된 페이지를 구분하는 데 가장 변별력 있는 단어들을 정보 이득(Information Gain) 기준으로 상위 128개 정도 선택하여 특징으로 삼았다.26 정보 이득 E(W, S)는 특정 단어 W의 유무가 페이지 집합 S의 클래스(hot/cold)를 예측하는 데 얼마나 많은 정보를 제공하는지를 정량화하는 척도이다.
E(W, S) = I(S) - \sum_{v \in \{\text{present, absent}\}} \frac{|S_v|}{|S|} I(S_v)
선택된 특징들을 기반으로 사용자 프로파일을 학습하기 위한 분류 모델로는 **나이브 베이즈 분류기(Naive Bayesian Classifier)**가 기본으로 사용되었다.26 이 모델은 각 단어(특징)가 주어진 클래스(hot 또는 cold)에 대해 서로 조건부 독립(conditionally independent)이라고 ‘순진하게(naively)’ 가정한다.30 이 가정은 현실에서는 잘 성립하지 않지만, 계산이 매우 효율적이고 적은 데이터로도 준수한 성능을 보여 텍스트 분류에 널리 사용되었다. 분류 규칙은 최대 사후 확률(Maximum A Posteriori, MAP) 추정에 기반하며, 특정 페이지가 ’hot’일 확률을 다음과 같이 계산한다 30:
\hat{y} = \underset{y \in \{\text{hot, cold}\}}{\operatorname{arg\,max}} P(y) \prod_{i=1}^{n} P(x_i \vert y)
여기서 P(y)는 클래스의 사전 확률(예: 전체 평가 중 ’hot’의 비율)이고, P(x_i \vert y)는 클래스 y에서 단어 x_i가 나타날 조건부 확률로, 훈련 데이터로부터 추정된다.
Syskill & Webert는 훗날 전자상거래와 소셜 미디어의 핵심 기술이 될 추천 시스템의 두 가지 주요 갈래, 즉 ’콘텐츠 기반 필터링’과 ‘협업 필터링’ 중 전자의 원형을 제시했다는 점에서 선구적인 연구로 평가받는다.
2.4 장: 1996년 주요 머신러닝 학회 동향 분석 (NIPS, ICML, AAAI)
1996년의 주요 기계학습 학회들은 특정 알고리즘의 등장을 넘어, 분야 전체의 패러다임이 통계적이고 확률적인 방법론으로 심화되고 있음을 명확히 보여주었다.
앙상블 방법론의 부상: 특히 이탈리아 바리에서 열린 ICML ’96에서는 앙상블(Ensemble) 방법론이 중요한 주제로 부상했다. 여러 개의 성능이 좋지 않은 학습기, 즉 ’약한 학습기(weak learners)’를 결합하여 강력한 성능의 단일 모델을 만드는 아이디어는 큰 주목을 받았다. 부스팅(Boosting), 특히 이후 AdaBoost로 발전하게 될 알고리즘들의 초기 연구들이 발표되며, 모델 결합을 통해 오류율을 획기적으로 줄일 수 있는 가능성을 제시했다.1
강화학습의 지속적 발전: 강화학습(Reinforcement Learning)은 이론적 발전을 넘어 실제 문제에 적용되기 시작했다. NIPS ’96과 AAAI-96에서는 시간차 학습(Temporal Difference learning)과 Q-러닝에 대한 분석이 심화되었고, 이를 이동 로봇의 계획 문제나 셀룰러 통신 시스템의 동적 채널 할당과 같은 현실적인 문제에 적용하는 연구들이 발표되었다.1 특히 Satinder P. Singh은 두 학회에서 모두 관련 연구를 발표하며 이 분야의 활발한 연구 동향을 이끌었다.5
베이즈 학습과 확률 모델의 확산: 불확실성을 명시적으로 모델링하는 베이즈적 접근법은 기계학습의 주류로 자리 잡고 있었다. NIPS ’96에서는 베이즈 신뢰 신경망(Bayesian Belief Networks)을 신경망 추정기로 학습하는 연구가 발표되었고 5, 역학 데이터 분석에 베이즈 신경망을 적용하여 과적합을 효과적으로 제어하는 사례도 보고되었다.32 ICML ’96에서도 베이즈 네트워크와 베이즈 평균화(Bayesian averaging) 등이 주요 주제로 다루어지며, 기계학습이 통계학과 깊이 융합되고 있음을 보여주었다.1
비지도 학습과 표현 학습: 레이블이 없는 데이터에서 의미 있는 구조를 발견하려는 비지도 학습(Unsupervised Learning) 연구 또한 활발했다. NIPS ’96에서는 독립 성분 분석(ICA)을 이용한 시점 불변 얼굴 인식 5, 자기조직화지도(SOM)를 이용한 음원 분리 및 밀도 추정 5, 그리고 훗날 비음수 행렬 분해(NMF)로 이어지는 볼록 및 원뿔 코딩(Convex and Conic Coding)을 통한 비지도 학습 연구 5 등 데이터의 잠재적 표현(representation)을 학습하려는 다양한 시도들이 발표되었다.
3. 로봇 공학의 도약 - 인간을 향한 발걸음
3.1 장: 휴머노이드 로봇의 새로운 시대 - 혼다 P2 공개
3.1.1 혼다의 비밀 프로젝트와 1996년 12월의 공개
1996년 12월 20일, 혼다는 로봇 공학계에 큰 충격을 안겨준 발표를 했다. 1986년부터 10년간 극비리에 진행해 온 이족보행 휴머노이드 로봇 연구의 결실인 ’P2’를 대중에게 처음으로 공개한 것이다.33 이전 프로토타입인 P1(1993)의 존재조차 비밀에 부쳐졌었기에, P2의 등장은 매우 갑작스러우면서도 혁신적인 사건이었다.34
P2가 기념비적인 성과로 평가받는 이유는 그것이 세계 최초로 동력원, 컴퓨터, 통신 장비 등 모든 시스템을 내장하여 외부 케이블 없이 완전히 자율적으로(self-contained) 움직이고, 무선으로 조종 가능한 인간 크기의 휴머노이드 로봇이었기 때문이다.34 P2의 공개는 로봇 공학의 목표가 공장 안의 정형화된 작업을 넘어, 인간이 생활하는 실제 공간으로 진입할 수 있다는 가능성을 현실 세계에 증명한 상징적인 사건이었다. 이는 ’서비스 로봇’이라는 새로운 연구 분야의 본격적인 시작을 알리는 신호탄과도 같았다.37
3.1.2 P2의 기술적 제원과 기능
P2는 당시 기술력의 집약체였다. 인간과 유사한 신체 비율을 가지도록 설계되었으며, 그 기술적 제원은 로봇 공학의 새로운 기준을 제시했다.
| 항목 (Specification) | 값 (Value) | 출처 (Source Snippet ID) |
|---|---|---|
| 높이 | 182 cm (1820 mm) | 33 |
| 무게 | 210 kg | 33 |
| 총 자유도 (DoF) | 30 DoF | 34 |
| 다리 자유도 | 12 DoF (한 다리당 6 DoF: 고관절 3, 무릎 1, 발목 2) | 36 |
| 팔 자유도 | 14 DoF (한 팔당 7 DoF: 어깨 3, 팔꿈치 1, 손목 3) | 36 |
| 손 자유도 | 2 DoF (한 손당 1 DoF) | 36 |
| 배터리 | Ni-Zn (니켈-아연) 배터리 | 34 |
| 작동 시간 | 약 15 분 | 34 |
| 탑재 컴퓨터 | 4개의 마이크로프로세서 (VxWorks 실시간 OS) | 36 |
| 주요 센서 | 몸통: 가속도계 3축, 자이로 3축 손목/발목: 6축 힘/토크 센서 머리: 비디오 카메라 4대 | 36 |
이러한 하드웨어를 바탕으로 P2는 놀라운 기능들을 선보였다. 단순히 평지를 걷는 것을 넘어, 인간처럼 계단을 오르내리고, 보행 중에 방향을 전환했으며, 카트를 밀거나 심지어 손으로 너트를 조이는 등의 간단한 작업까지 수행했다.33 이는 로봇이 인간을 위해 설계된 환경(계단, 문)과 도구(카트, 드라이버)를 직접 사용할 수 있는 잠재력을 명확히 보여준 사례였다.
3.2 장: 안정적 이족보행의 핵심 - 영 모멘트 포인트(ZMP) 제어
3.2.1 이족보행의 동역학적 난제
두 발로 걷는 행위는 동역학적으로 매우 불안정한 과정이다. 본질적으로 한 발로 무게 중심을 지탱하며 다른 발을 앞으로 내딛는, 즉 ’제어된 넘어짐(controlled falling)’의 연속이기 때문이다. 로봇이 넘어지지 않고 안정적인 보행을 유지하기 위해서는 자신의 무게 중심과 움직임으로 인해 발생하는 모든 힘과 모멘트를 정밀하게 제어해야 하는 근본적인 어려움이 있다.
3.2.2 ZMP(Zero Moment Point)의 이론적 기반
혼다 P2의 안정적인 보행을 가능하게 한 핵심 이론이 바로 영 모멘트 포인트(Zero Moment Point, ZMP) 제어이다. ZMP는 로봇의 발바닥과 지면이 접촉할 때, 지면 반력에 의해 발생하는 모멘트의 수평 성분이 0이 되는 지면 위의 한 점으로 정의된다.39 쉽게 말해, 로봇의 움직임으로 인해 발생하는 모든 관성력과 중력의 합력이 이 점을 통과하면, 로봇은 수평 방향으로 넘어지려는 회전력(모멘트)을 받지 않고 안정된 상태를 유지할 수 있다. 따라서 로봇의 ZMP를 항상 발바닥의 지지 다각형(support polygon) 내부에 위치시키면 이론적으로 안정적인 보행이 가능하다.
ZMP의 위치는 로봇의 전체 질량, 무게 중심의 가속도, 그리고 각 관절의 각운동량 변화 등을 포함하는 복잡한 동역학 방정식으로 계산된다. 그 수학적 정의는 다음과 같다 39:
\vec{PZ} = \frac{\mathbf{n} \times \mathbf{M}_P^{gi}}{\mathbf{F}^{gi} \cdot \mathbf{n}}
여기서 \mathbf{M}_P^{gi}는 관성력과 중력에 의한 모멘트, \mathbf{F}^{gi}는 그 합력, \mathbf{n}은 지면의 법선 벡터, P는 지면 위의 임의의 점, Z가 바로 ZMP를 나타낸다.
3.2.3 P2의 ZMP 기반 보행 제어 아키텍처
혼다의 P2는 ZMP 이론을 실제 로봇 제어에 성공적으로 적용한 대표적인 사례이다.39 P2의 보행 제어 시스템은 로봇의 복잡한 동역학을 ’ZMP’라는 하나의 간결한 물리량으로 요약하고, 이를 제어 목표로 삼음으로써 고차원의 비선형 제어 문제를 실시간으로 해결 가능한 문제로 변환시켰다. 이 제어 아키텍처는 크게 세 단계로 구성된다:
-
목표 ZMP 궤적 생성: 보행을 시작하기 전에, 로봇의 발걸음 위치와 시간에 맞춰 ZMP가 따라가야 할 이상적인 경로(trajectory)를 미리 계획한다. 이 경로는 일반적으로 지지하고 있는 발바닥의 중심 근처를 부드럽게 이동하도록 설계된다.40
-
실제 ZMP 측정: P2는 각 발바닥에 장착된 6축 힘/토크 센서를 통해 지면과 주고받는 실제 힘과 모멘트를 실시간으로 측정한다.36 이 측정값을 바탕으로 현재 로봇의 실제 ZMP 위치, 즉 C-ATRGF(Center of Actual Total Ground Reaction Force)를 계산한다.36
-
피드백 제어: 측정된 실제 ZMP(
C-ATRGF)와 미리 계획된 목표 ZMP 궤적 사이의 오차를 계산한다. 만약 실제 ZMP가 목표 지점을 벗어나면, 로봇은 이 오차를 줄이기 위해 몸통의 자세를 기울이거나, 발을 내딛는 위치를 미세하게 조정하는 등의 피드백 제어를 수행한다.42 이 과정에는 ‘모델 ZMP 제어’, ‘지면 반력 제어’, ’발 착지 위치 제어’와 같은 여러 제어 기법들이 복합적으로 작용하여, 예상치 못한 지면의 불균일함이나 외부 힘에도 안정성을 유지하게 한다.41
이러한 모델 기반 제어 방식은 P2의 보행이 단순한 패턴 재생이 아니라, 자신의 물리 모델에 대한 이해를 바탕으로 한 ’예측 및 피드백 제어’의 결과물임을 보여준다. 이는 로봇 지능이 물리 세계와의 상호작용을 정밀하게 모델링하고 제어하는 능력에 있음을 명확히 한 중요한 성과였다.
3.3 장: 고차원 공간 탐색의 해법 - 무작위 로드맵 경로 계획
3.3.1 다자유도 로봇 경로 계획의 복잡성
로봇 팔이나 휴머노이드처럼 여러 개의 관절을 가진 다자유도(many Degrees of Freedom, DoF) 로봇의 움직임을 계획하는 것은 매우 어려운 문제이다. 로봇의 모든 가능한 자세(configuration)의 집합을 C-공간(Configuration Space)이라고 하는데, 로봇의 자유도가 하나씩 늘어날 때마다 C-공간의 차원이 증가하여 탐색해야 할 공간이 기하급수적으로 커진다. 이를 ’차원의 저주(curse of dimensionality)’라고 부른다.44 특히 C-공간 내에서 장애물들 사이에 형성된 좁은 통로(narrow passages)를 통과하는 경로를 찾는 것은, 격자 탐색과 같은 전통적인 결정론적 알고리즘으로는 사실상 해결이 불가능에 가까웠다.45
3.3.2 ICRA-96의 새로운 접근: Randomized Roadmap Method
1996년 IEEE 로보틱스 및 자동화 국제 학회(ICRA)에서 Nancy Amato와 Yan Wu는 이러한 고차원 경로 계획 문제에 대한 새로운 해법을 제시했다.45 그들의 ’무작위 로드맵 방법(Randomized Roadmap Method)’은 확률적 샘플링에 기반한 PRM(Probabilistic Roadmap Method) 계열의 연구로, 샘플링 전략에 대한 중요한 통찰을 제공했다.47
이 방법론의 핵심 아이디어는 맹목적인 무작위 샘플링의 비효율성을 극복하는 데 있었다. C-공간 전체에 걸쳐 균일하게 샘플링하는 대신, 경로 탐색의 성패를 좌우하는 ‘어려운’ 영역, 즉 좁은 통로를 찾을 확률이 높은 곳에 샘플링을 집중하는 것이다. 그들은 이러한 어려운 경로가 대부분 C-장애물 표면(C-obstacle surfaces) 근처에 존재할 것이라는 통찰을 바탕으로, 로드맵의 후보 노드를 C-장애물 표면 위에서 집중적으로 생성하는 전략을 제안했다.46
C-장애물 표면 위의 점을 효율적으로 찾기 위해 다음과 같은 휴리스틱 알고리즘을 사용했다 46:
-
먼저 C-장애물 내부에 있는 임의의 시작점 o를 찾는다.
-
점 o에서 출발하여 C-공간의 모든 방향으로 균일하게 분포된 다수의 가상 광선(ray)을 생성한다.
-
각 광선에 대해, 시작점 o(충돌 상태)와 광선 위의 먼 점(비충돌 상태일 가능성이 높음) 사이에서 이진 탐색(binary search)을 수행한다. 이진 탐색 과정에서 반복적으로 충돌 검사를 수행하여, 충돌 상태와 비충돌 상태의 경계가 되는 지점, 즉 C-장애물의 표면 위의 점을 찾아낸다. 이 점들이 로드맵의 후보 노드가 된다.
이렇게 생성된 노드들을 간단한 로컬 플래너(local planner)로 연결하여 그래프 형태의 로드맵을 구축한다. 실제 경로 계획 시에는 시작점과 목표점을 이 로드맵에 연결한 뒤, 그래프 탐색 알고리즘(예: A*)을 사용하여 최적 경로를 빠르게 찾을 수 있다.48
3.3.3 방법론의 장점과 의의
Amato와 Wu의 접근법은 C-장애물 표면에 노드를 집중시킴으로써, 기존의 균일 샘플링 방식으로는 찾기 매우 어려웠던 좁은 통로를 효과적으로 탐색하고 통과하는 경로를 생성할 확률을 극적으로 높였다.46 또한, 로봇이 물체와 접촉하며 작업을 수행해야 하는 조작 계획(manipulation planning) 문제에도 동일한 원리를 적용할 수 있는 확장성을 보였다.45
이 연구는 ’무작위성’을 문제 해결에 사용하는 방식에 대한 중요한 교훈을 남겼다. 즉, 맹목적인 무작위성이 아니라, 문제의 구조에 대한 깊은 통찰(‘어려운 경로는 장애물 근처에 있다’)을 바탕으로 한 ’편향된 무작위성(biased random sampling)’이 훨씬 더 강력하고 효율적이라는 것이다. 이는 샘플링 기반 방법론이 정교한 휴리스틱과 결합될 때 비로소 강력한 문제 해결 도구가 될 수 있음을 보여준 대표적인 사례이다.
| 기준 (Criteria) | 기존 방법론 (예: Potential Field) | 무작위 샘플링 (예: Uniform PRM) | 장애물 기반 샘플링 (Amato & Wu ’96) |
|---|---|---|---|
| 기본 원리 | C-공간 상의 가상적인 힘(인력/척력)을 따라 이동 | C-공간 전체에서 무작위로 노드를 샘플링하여 로드맵 구축 | C-장애물 표면에서 집중적으로 노드를 샘플링하여 로드맵 구축 |
| ‘좁은 통로’ 문제 | 국소 최저점(local minima)에 빠져 실패할 확률이 높음 49 | 통로 내부를 샘플링할 확률이 매우 낮아 찾기 어려움 46 | 통로 입구를 샘플링할 확률이 높아 효과적으로 해결 가능 48 |
| 계산 복잡성 | 비교적 낮지만, 복잡한 환경에서 비효율적 | 샘플 수에 비례, 좁은 통로 해결 위해 많은 샘플 필요 | 노드 생성 비용은 높지만, 적은 노드로 고품질 로드맵 생성 가능 48 |
| 완결성 | 완결성 보장 안됨 | 확률적 완결성(Probabilistic Completeness) 보장 | 확률적 완결성 보장 |
3.4 장: 1996년 주요 로봇공학 학회 동향 분석 (ICRA, IROS)
1996년의 주요 로봇공학 학회인 ICRA와 IROS에서는 로봇이 물리적 세계와 더 정교하게 상호작용하고, 인간과 더 원활하게 협력하기 위한 다양한 기술들이 발표되었다.
다양한 센싱 기술의 발전: 로봇이 주변 환경을 인식하는 능력을 향상시키기 위한 연구가 활발했다. ICRA-96에서는 반도체 미세가공 기술(micromachined)을 이용한 고밀도 촉각 센서 배열, 5차원 변형을 감지할 수 있는 새로운 구조의 촉각 센서 등 인간의 촉각을 모방하려는 시도들이 발표되었다.50 이는 로봇이 물체를 더 정교하게 조작하기 위한 필수적인 기술이었다.
인간-로봇 상호작용의 진화: 로봇을 더 직관적으로 제어하고 가르치려는 연구도 중요한 흐름을 형성했다. 자연어를 통해 로봇에게 작업을 지시하거나 50, 인간의 동작을 로봇이 보고 배우는 ‘인간 시연 기반 로봇 프로그래밍(Robot Programming by Human Demonstration)’ 기술이 ICRA-96에서 발표되었다.50 이는 로봇 프로그래밍의 장벽을 낮추고 비전문가도 로봇을 활용할 수 있게 하는 중요한 연구 방향이었다.
자율 이동 및 항법 기술: 이동 로봇이 스스로 환경을 탐색하고 위치를 파악하는 기술도 꾸준히 발전했다. 특히 사전에 구축된 명시적인 3D 모델 없이, 시각 정보만을 이용하여 로봇의 위치를 추정하는 연구나, 파노라마 카메라 뷰를 이용해 경로를 표현하고 항법에 사용하는 연구가 ICRA-96에서 발표되며 시각 기반 자율 주행 기술의 가능성을 보여주었다.50
산업용 로봇 시장의 회복과 응용 확대: 학술적 발전과 더불어 산업 현장에서의 로봇 활용도 중요한 전환점을 맞았다. 1996년 전 세계 산업용 로봇 판매량은 약 80,500대로, 1990년의 최고 수준을 거의 회복했다.4 주요 적용 분야는 여전히 용접과 조립이었으며, 특히 자동차 산업이 전체 로봇 수요의 40%에서 70%를 차지하며 기술 확산을 주도했다.4 이는 로봇 공학 연구가 산업 현장의 실질적인 수요와 밀접하게 연결되어 발전하고 있었음을 보여주는 지표이다.
4. 결론: 1996년의 유산과 미래 전망
1996년은 인공지능과 로봇 공학의 역사에서 단순한 한 해가 아니라, 두 분야가 각자의 이론적 성숙을 바탕으로 실질적인 융합을 시작하며 미래 기술의 청사진을 제시한 결정적인 해였다.
이론과 구현의 융합: 이 해에는 LSTM, CONDENSATION, 나이브 베이즈 기반 에이전트와 같이 정교한 확률 및 통계 기반의 AI 이론이 학문적 깊이를 더하는 동시에, 혼다 P2와 같이 이러한 이론들이 복잡한 물리 시스템과 통합되어 현실 세계에서 구현될 수 있음을 증명하는 성과가 나타났다. 이는 추상적인 지능 이론과 구체적인 물리적 행동 사이의 간극이 좁혀지기 시작했음을 의미한다.
핵심 문제에 대한 근본적 해결책 제시: 1996년에 발표된 연구들은 각 분야가 오랫동안 직면해 온 난제들에 대한 근본적인 해결의 실마리를 제공했다. LSTM은 순환 신경망의 ‘기울기 소실’ 문제를 구조적으로 해결하여 장기 기억의 길을 열었고, CONDENSATION 알고리즘은 ‘비-가우시안 불확실성’ 하에서의 강건한 추적 문제를 해결했다. 또한, Amato와 Wu의 무작위 로드맵 방법은 ’고차원 경로 계획’의 복잡성을 극복할 새로운 방향을 제시했다.
미래 기술의 씨앗: 1996년에 뿌려진 씨앗들은 이후 풍성한 결실을 보았다. LSTM은 딥러닝 시대에 자연어 처리와 시계열 분석의 표준 아키텍처로 자리 잡았다. 혼다 P2와 ZMP 제어 기술은 ASIMO를 거쳐 오늘날 전 세계 모든 휴머노이드 로봇 연구의 기초가 되었다. 무작위 샘플링 기반 경로 계획은 자율주행차, 드론 등 현대 자율 이동 시스템의 핵심 기술로 발전했다. 또한, Syskill & Webert가 보여준 개인화 에이전트의 개념은 현재의 거대한 추천 시스템 및 개인화 광고 시장의 원형이 되었다.
종합 평가: 결론적으로 1996년은 AI와 로봇 공학이 지능적인 ‘인식(Perception)’, ‘추론(Reasoning)’, 그리고 ’행동(Action)’을 하나의 통합된 시스템 안에서 구현하려는 시도를 본격화한 해였다. 이는 진정한 의미의 ‘지능형 로봇’ 시대의 서막을 연 중대한 전환점이었으며, 21세기 AI 혁명을 가능하게 한 기술적, 사상적 토대를 마련한 해로 평가할 수 있다.
5. 참고 자료
- Machine Learning Proceedings of the Thirteenth International Conference 1996 - eBay, https://www.ebay.com/itm/226892470699
- History of artificial intelligence - Wikipedia, https://en.wikipedia.org/wiki/History_of_artificial_intelligence
- Press Releases 1996 - UNECE, https://unece.org/fileadmin/DAM/press/pr1996/96ind7.htm
- World Industrial Robots 1997: IFR statistics 1986-1996 and forecast to 2000, https://www.emerald.com/ir/article/doi/10.1108/ir.1998.04925aab.001/182720/World-Industrial-Robots-1997-IFR-statistics-1986
- Advances in Neural Information Processing Systems 9 (NIPS 1996), https://proceedings.neurips.cc/paper/1996
- Neural Information Processing Systems (NIPS) - SIGMOD, http://www.sigmod.org/publications/dblp/db/conf/nips/index.html
- Machine learning : proceedings of the thirteenth international conference (ICML ’96) : Bari, Italy, July 3-6, 1996 - University of Technology Sydney, https://search.lib.uts.edu.au/discovery/fulldisplay?docid=alma991001053449705671&context=L&vid=61UTS_INST:61UTS&lang=en&adaptor=Local%20Search%20Engine&tab=Everything&query=sub%2Cexact%2C%20Machine%20learning%20%2CAND&mode=advanced
- Proceedings of the AAAI Conference on Artificial Intelligence, 13 Archives, https://aaai.org/proceeding/aaai-13-1996/
- AAAI-96: Thirteenth National Conference on Artificial Intelligence, https://aaai.org/conference/aaai/aaai96/
- IROS: Proceedings of the … IEEE/RSJ International Conference on - Google Books, https://books.google.com/books/about/IROS.html?id=jgVWAAAAMAAJ
- Robots with integrated locomotion and manipulation and their future, https://pure.bit.edu.cn/en/publications/robots-with-integrated-locomotion-and-manipulation-and-their-futu-2
- IEEE International Conference on Robotics and Automation : ICRA - McMaster Experts, https://experts.mcmaster.ca/display/journal-ieee-international-conference-on-robotics-and-automation–icra–proceedings-ieee-international-conference-on-robotics-and-automation
- Proceedings 1996 IEEE International Conference on Robotics and Automation - Nanyang Technological University, https://ntu-sp.primo.exlibrisgroup.com/discovery/fulldisplay?vid=65NTU_INST%3A65NTU_INST&docid=alma991016308604805146&context=L
- (PDF) Long Short-Term Memory - ResearchGate, https://www.researchgate.net/publication/13853244_Long_Short-Term_Memory
- LONG SHORT-TERM MEMORY 1 INTRODUCTION, https://www.bioinf.jku.at/publications/older/2604.pdf
- Long short-term memory - PubMed, https://pubmed.ncbi.nlm.nih.gov/9377276/
- Long short-term memory - Wikipedia, https://en.wikipedia.org/wiki/Long_short-term_memory
- [PDF] Long Short-Term Memory - Semantic Scholar, https://www.semanticscholar.org/paper/Long-Short-Term-Memory-Hochreiter-Schmidhuber/2e9d221c206e9503ceb452302d68d10e293f2a10
- Long Short-Term Memory - Solving the Memory Problem - Interactive | Michael Brenndoerfer, https://mbrenndoerfer.com/writing/history-lstm-long-short-term-memory
- CONDENSATION—Conditional Density Propagation for Visual …, http://vision.stanford.edu/teaching/cs231b_spring1415/papers/isard-blake-98.pdf
- Condensation conditional density propagation for visual tracking Michael Isard and Andrew Blake, Department of Engineering Sci - CMU School of Computer Science, https://www.cs.cmu.edu/~motionplanning/papers/sbp_papers/integrated2/isard_condensation_visual.pdf
- Condensation Algorithm, https://www.dcs.gla.ac.uk/~jhw/cond.html
- The CONDENSATION Algorithm - Conditional Density Propagation and Applications to Visual Tracking - NIPS, https://proceedings.neurips.cc/paper/1996/hash/0829424ffa0d3a2547b6c9622c77de03-Abstract.html
- The Condensation algorithm | conditional density propagation and applications to visual tracking - Michael Isard, http://michaelisard.com/pubs/nips96.pdf
- Condensation “” conditional density propagation for visual tracking - Microsoft Research, https://www.microsoft.com/en-us/research/publication/condensation-conditional-density-propagation-for-visual-tracking/
- 1996-Syskill & Webert: Identifying Interesting Web Sites, https://cdn.aaai.org/AAAI/1996/AAAI96-008.pdf
-
- AAAI / 8. IAAI 1996: Portland, Oregon, https://www.sigmod.org/publications/dblp/db/conf/aaai/aaai96-1.html
- Syskill and Webert: Identifying Interesting Web Sites - AAAI, https://aaai.org/papers/008-aaai96-008-syskill-and-webert-identifying-interesting-web-sites/
- Syskill & Webert: Identifying Interesting Web Sites, https://cdn.aaai.org/Symposia/Spring/1996/SS-96-05/SS96-05-010.pdf
- 1.9. Naive Bayes — scikit-learn 1.7.2 documentation, https://scikit-learn.org/stable/modules/naive_bayes.html
- Naive Bayes classifier - Wikipedia, https://en.wikipedia.org/wiki/Naive_Bayes_classifier
- A Comparison between Neural Networks and other Statistical Techniques for Modeling the Relationship between Tobacco and Alcohol and Cancer - NIPS, https://papers.nips.cc/paper/1252-a-comparison-between-neural-networks-and-other-statistical-techniques-for-modeling-the-relationship-between-tobacco-and-alcohol-and-cancer
- Japan Atlas: Two-Legged Walking Robot - Web-Japan.org, https://web-japan.org/atlas/technology/tec11.html
- Honda P series - Wikipedia, https://en.wikipedia.org/wiki/Honda_P_series
- Honda P2 Robot Demonstration - YouTube, https://www.youtube.com/watch?v=FEXSqsW6rMM
- The Development of Honda Humanoid Robot - Robotics and …, https://www.cs.cmu.edu/~cga/humanoids/honda.pdf
- (PDF) The evolution of robotics research - ResearchGate, https://www.researchgate.net/publication/3344813_The_evolution_of_robotics_research
- The Honda Humanoid Robots: (a) P2 and (b) P3. - ResearchGate, https://www.researchgate.net/figure/The-Honda-Humanoid-Robots-a-P2-and-b-P3_fig5_228588391
- Zero moment point - Wikipedia, https://en.wikipedia.org/wiki/Zero_moment_point
- (a) Bip foot. (b) Honda P2 dimensions (in millimeters). - ResearchGate, https://www.researchgate.net/figure/a-Bip-foot-b-Honda-P2-dimensions-in-millimeters_fig3_3412330
- (PDF) The Human-size Humanoid Robot That Can Walk, Lie Down and Get Up., https://www.researchgate.net/publication/220121926_The_Human-size_Humanoid_Robot_That_Can_Walk_Lie_Down_and_Get_Up
- How ASIMO Works - Science | HowStuffWorks, https://science.howstuffworks.com/asimo.htm
- ASIMO and Humanoid Robot Research at Honda - CS@Columbia, https://www.cs.columbia.edu/~allen/S19/ASIMO.pdf
- An obstacle-based rapidly-exploring random tree - ResearchGate, https://www.researchgate.net/publication/4246439_An_obstacle-based_rapidly-exploring_random_tree
- Randomized roadmap method for path and manipulation planning - Illinois Experts, https://experts.illinois.edu/en/publications/randomized-roadmap-method-for-path-and-manipulation-planning
- A Randomized Roadmap Method for Path and Manipulation Planning, https://www.cs.cmu.edu/~motionplanning/papers/sbp_papers/PRM/othersprm_04.pdf
- OBRRT: Obstacle-Based RRT - Parasol Lab, https://parasollab.web.illinois.edu/research/obrrt/
- Randomized roadmap method for path and manipulation planning - ResearchGate, https://www.researchgate.net/publication/3631360_Randomized_roadmap_method_for_path_and_manipulation_planning
- A Randomized Roadmap Method For Path and Manipulation Planning | PDF - Scribd, https://www.scribd.com/document/776134260/a-randomized-roadmap-method-for-path-and-manipulation-planning
- Proceedings of the 1996 IEEE International Conference on Robotics and Automation, Minneapolis, Minnesota, USA, April 22-28, 1996 - Researchr, https://researchr.org/publication/icra-1996